Основная концепция — Мозг и руки
В наших предыдущих лабораторных работах мы увидели, насколько мощными являются большие языковые модели (LLM), но также выявили серьёзный недостаток: они замкнуты в своей оболочке. Они знают только то, чему их обучили, и не могут взаимодействовать с реальным миром.
Агенты ИИ решают эту проблему, объединяя два разных компонента:
- Мозг: Большая языковая модель (например, Qwen3-4B), которая понимает человеческий язык, обрабатывает логику и поддерживает контекст разговора.
- Руки: Код на Python и внешние инструменты (API), которые могут активно взаимодействовать с реальным миром — например, проверять погоду, просматривать интернет или выполнять расчёты.
Обучение мозга использованию рук
Большая языковая модель не может естественным образом «нажимать» кнопки или «запускать» код на Python. Сегодня наша цель — научить мозг определять, когда ему нужна помощь, и форматировать свой вывод так, чтобы наша программа на Python могла запустить инструмент за него его.
